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"Architettura dx codificatore/decodificatore e relativo 
sistema elaborativo" 

* * * 

Campo dell' invenzione 

La presente invenzione si riferisce ai dispositivi 
codif icatori/decodif icatori ed in particolare alia loro 
architettura . 

Descrizione della tecnica nota 

II problema di ridurre 1'attivita di commutazione 
nelle linee bus con elevati carichi capacitivi e stato 
affrontato in misura estesa nella tecnica. 

Esistono in particolare tecniche basate sulla 
soluzione di codificare le sorgenti dati prima della 
trasmissione sul bus in funzione delle caratteristiche 
spettrali specifiche dei flussi e delle conf igurazioni 
da scambiare. 

Ad esempio, nel lavoro di M.R. Stan, W.P. 
Burleson, "Bus-Invert Coding for Low-Power I/O", IEEE 
Transactions on Very Large Scale Integration Systems, 
Vol. 3, No. 1, pp. 49-58, March 1995, gli autori hanno 
proposto uno schema di codifica ridondante, denominate 
codice Bus-Invert, adatto per trasmettere 

conf igurazioni distribuite in modo casuale nel tempo, 
ad esempio per bus dati. I principali inconvenienti di 
questo modo di procedere sono legati alia ridondanza 
richiesta sulle linee di bus ed agli overhead in 
termini di potenza e di ritardo introdotti dai 
cosiddetti majority voter compresi nel codif icatore . 

Per quanto riguarda i bus di indirizzamerito, sono 
state studiate altre tecniche basate sul cosiddetto 
principio della localita spaziale. Al riguardo si puo 
far utilmente riferimento al volume di J. L. Hennessy, 
D. A. Patterson, Computer Architecture - A Quantitative 
Approach, II Edition, Morgan Kaufmann Publishers, 1996. 
Nel caso dei bus di indirizzamento e di solito 



28-04-2000 



EPO0830322.4 

- 



SPEC 



prevalente 1' indirizzamento sequenziale, per cui la 
correlazione temporale fra indirizzi successivi e in 
generale molto elevata. Nel lavoro di C. L. Su, C. Y. 
Tsui, A. M. Despain, "Saving Power in the Control Path 
5 of Embedded Processors", IEEE Design and Test of 
Computers, Vol* 11, No. 4, pp. 24-30, Winter 1994 e 
stato proposto di codificare le conf igurazioni con un 
codice Gray tale da garantire fra indirizzi consecutivi 
una transizione di un solo bit. Tuttavia in questo 

10 lavoro non viene preso in considerazione 1' overhead di 
potenza causato dalla presenza del 

codif icatore/decof icatore Gray. Nel lavoro di H. Mehta, 
R. M. Owens, M. J. Irwin, "Some Issues in Gray Code 
Addressing", GLS-VLSI-96: IEEE 6th Great Lakes 

15 Symposium on VLSI, pp. 178-180, Ames, IA, March 1996 e 
stata svolta un'ulteriore analisi sull' indirizzamento 
basato sui codici Gray e sulle relative architetture, 
prendendo in particolare in considerazione l'aspetto 
della modifica del codice Gray in modo da conservare la 

20 proprieta di singola transizione negli indirizzi 
consecutivi nel caso delle macchine con indirizzamento 
su byte. 

Nei lavori L. Benini, G. De Micheli, E. Macii, D. 
Sciuto, C. Silvano, "Asymptotic Zero-Transition 

25 Activity Encoding for Address Busses in Low-Power 
Microprocessor-Based Systems", GLS-VLSI-97: IEEE 7th 
Great Lakes Symposium on VLSI, pp. 77-82, Urbana, IL, 
March 1997 e L. Benini, G. De Micheli, E. Macii, D. 
Sciuto, C. Silvano, "Address Bus Encoding Techniques 

30 for System-Level Power Optimization", DATE-98, pp. 861- 
866, Feb. 1998 e stato proposto uno schema di codifica 
ridondante, denominato codice TO, tale da evitare il 
trasf erimento sul bus di indirizzi consecutivi. Questo 
risultato viene ottenuto utilizzando una linea 

35 ridondante INC, per trasferire al sotto-sistema che 



funge da ricevitore 1' inf ormazione relativa 
all' organizzazione sequenziale degli indirizzi. Gli 
incrementi fra conf igurazioni consecutive possono 
essere parametrici, in modo da riflettere lo schema di 
indirizzabilita adottato nella architettura di memoria. 
In condizioni di regime stazionario di flussi infiniti 
di indirizzi consecutivi , il codice TO presenta la 
proprieta data dal numero delle transizioni sul bus 
pari a 0. Questo mentre 1' indirizzamento basato sul 
codice Gray richiede una commutazione o transizione di 
un bit per ciascuna coppia di conf igurazioni 
consecutive . 

Un' estensione delle potenzialita del codice TO 
proposto nei due ultimi lavori citati e data dal codice 
TO-Xor, ottenuto combinando il codice TO con una 
funzione Xor. La presenza di questa funzione, che ha 
effetto di decorrelazione, evita di dover introdurre 
nel bus la linea ridondante INC, necessaria per il 
codice TO. Va notato che il codice TO-Xor pud essere 
anche derivato dall' architettura proposta nel lavoro di 
S. Ramprasad, N. R. Shanbhag, I. N. Hajj, "A Coding 
Framework for Low-Power Address and Data Busses", IEEE 
Trans- On Very Large Scale Integration (VLSI) Systems, 
Vol. 7, No. 2, June 1999, pp. 212-221, dove e stato 
indicato come codice Inc-Xor. 

Nel caso del cosiddetto codice Offset, sul bus 
viene trasmessa la differenza fra il valore corrente di 
b (t) ed il precedente valore b (t-1) . Quando i valori 
trasmessi sui bus presentano un' elevata correlazione, 
il valore sulle linee di bus codificate B (t) viene 
ridotto e viene mantenuto costante per dati in 
sequenza. La differenza adotta la codifica di segno e 
grandezza (magnitudine) con il bit di segno 
rappresentato come bit ridondante. 
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Nel codice Offset-Xor viene dapprima calcolata la 
differenza (b (t) - b (t_1) )/ per poi attuare una funzione 
xor fra il valore delle linee di bus codificate ai 
tempi t e t-1. La funzione xor ha un effetto di 
decorrelazione sull'uscita. Infatti essa semplicemente 
traduce i bit di B <u con valore pari ad 1 in 
transizioni sulle linee di bus, mentre i bit con valore 
pari a 0 corrispondono a linee di bus stazionarie. 

Nel codice TO-Offset, le potenzialita del codice 
TO vengono estese adottando lo schema TO per valori di 
bus in sequenza, mentre per i valori di bus fuori 
sequenza viene utilizzato il codice Offset. L' idea di 
base sfrutta ancora il principio di localita spaziale: 
si assume infatti che per i valori di bus fuori 
sequenza, il fatto di procedere alia codifica delle 



dif f erenze 



(b 
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(t-i> 



) potrebbe implicare meno 
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transizioni sulle linee di bus rispetto alia codifica 
binaria del valore b (t) . 

Ancora altri codici possono essere derivati 
estendendo le possibility dei codici presentati o 
semplicemente combinando i codici precedent!, cosi come 
illustrato nel lavoro di L. Benini, G. De Micheli, E. 
Macii, D. Sciuto, C. Silvano gia citato in precedenza, 
dove sono stati derivati i codici Dual-TO, TO-BI e 
Dual-TO-BI. 

II codice TO-Xor-Of f set puo essere derivato 
combinando lo schema TO-Xor per valori di bus in 
sequenza adottando invece il codice Offset per i valori 
di bus fuori sequenza. 

Nel codice TO con valore variabile del cosiddetto 
stride, vale a dire il codice TO-Var, lo stride fra 
conf igurazioni consecutive puo essere reso parametrico. 
Si introducono linee di bus ridondanti per poter 
trattare valori diversi di stride (cosi come 4, 8 e 16) 
cosi da poter rappresentare le distanze che piu 
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f requentemente ricorrono fra indirizzi consecutivi. Per 
n valori di stride Si, S 2 , S n sono necessarie log 2 

(S n ) linee ridondanti, vale a dire INCi, INC2, • 
INC. 

5 Nel codice Bus-Invert ridotto, nominato anche 

codice Red-BI, viene sfruttato il fatto che i bit piu 
signif icativi del bus di sistema presentano un'attivita 
di transizione inferiore rispetto ai bit meno 
signif icativi . Si riduce cosi ad un numero inferiore a 

10 N/2 la soglia dopo la quale si inverte il valore del 
bus. Ad esempio, si pud implementare il procedimento 
utilizzando un numero ridotto di 28 o 24 linee di bus 
invece di 32 linee di bus . 

II lavoro di E. Musoll, T. Lang, J. Cortadella 

15 "Working-Zone Encoding for Reducing the Energy in 
Microprocessor Address Buses' 7 , IEEE Transactions on 
Very Large Scale Integration (VLSI) Systems, Vol. 6, 
No. 4, pp. 568-572, Dec. 1998 trae spunto dalla 
considerazione del fatto che a ciascun istante di tempo 

2 0 un determinate programma tende a favorire un numero 
limitato di zone di lavoro dello spazio della memoria 
degli indirizzi. Di conseguenza, dato il riferimento 
alia zona di lavoro cor rente, il bus trasmette solo 
1' inf ormazione relativa alio spostamento di questo 

25 riferimento rispetto al precedente riferimento a tale 
zona . 

Lo schema di codifica per zona di lavoro (WZE, 
acronimo per Working Zone Encoding) e adatto quando la 
sequenzialita degli indirizzi viene distrutta o per 

30 effetto degli accessi interallacciati verso diverse 
schiere di dati ovvero dagli accessi interallacciati a 
locazioni di istruzioni e di dati. La principale 
limitazione di questa tecnica e data dal suo overhead 
logico fisso del codif icatore/decodif icatore, che e piu 

35 elevato, tale da limitare i vantaggi in termini di 
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potenza legati alia riduzione all' attivita di 
commutazione . In piu, questa soluzione introduce 
ritardi addizionali nei cammini critici di segnale. Un 
ulteriore inconveniente e dato dal fatto di richiedere 
5 linee di bus ridondanti per comunicare il cambiamento 
della zona di lavoro. Inoltre, questa tecnica si fonda 
su ipotesi piuttosto vincolanti sulle conf igurazioni 
nel flusso. Se la politica di accesso ai dati non e 
basata su schiere, oppure se il numero delle zone di 

10 lavoro e troppo elevato, questo schema di codifica 
perde la sua efficacia. 

Altre tecniche di codifica a livello di sistema 
sono state prese in esame nei lavori M. R. Stan, W. P. 
Burleson, "Low-Power Encodings for Global Communication 

15 in CMOS VLSI", IEEE Transactions on Very Large Scale 
Integration (VLSI) Systems, Vol. 5, No. 4, pp. 444-455, 
Dec. 1997 e M. R. Stan, W. P. Burleson, "Limited-Weight 
Codes for Low-Power", IWLPD-94: IEEE/ACM International 
Workshop on Low Power Design, pp. 209-214, Napa Valley, 

20 CA, April 1994, mentre un generale contesto di 
codif ica/decodif ica mirante a ridurre l'attivita di 
transizione e stata recentemente proposta nel lavoro di 
S. Ramprasad, N. R. Shanbhag, I. N. Hajj, "A Coding 
Framework for Low-Power Address and Data Busses", IEEE 

25 Trans. On Very Large Scale Integration (VLSI) Systems, 
Vol. 7, No. 2, June 1999, pp. 212-221 gia citato in 
precedenza . Sebbene la maggior parte delle tecniche di 
codifica a bassa potenza possano essere implementate 
riferendosi a questo contesto, il cammino critico per 

30 trasmettere 1' informazione sul bus pud avere 
un' influenza signif icativa sulle prestazioni a livello 
di sistema. Le considerazioni di natura teorica sulle 
tecniche di codifica di bus a numero ridotto di 
transizioni sono state analizzate nel lavoro di S. 

35 Ramprasad, N. R. Shanbhag, I. N. Hajj, vx Inf ormation- 
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Theoretic Bounds on Average Signal Transistion 
Activity", IEEE Trans. On Very Large Scale Integration 
(VLSI) Systems, Vol. 7, No. 3, Sep. 1999, pp. 359-368, 
dove gli autori derivano limiti rispettivamente 
inferiore e superiore dell' attivita media di 
transizione di segnale. 

Tutti gli schemi menzionati in precedenza sono 
adatti per sistemi a microprocessore di tipo general 
purpose, mentre nel lavoro di L. Benini, G . De Micheli, 
E. Macii, M. Poncino, S. Quer, "Power Optimization of 
Core-Based Systems by Address Bus Encoding", IEEE 
Transactions on Very Large Scale Integration (VLSI) 
Systems, Vol. 6, No. 4, pp. 554-562, Dec. 1998 sono 
state analizzati metodi di codifica dipendenti 
dall' applicazione per sistemi di tipo embedded 
destinati a funzioni specifiche. Nel lavoro di L. 
Benini, A. Macii, E. Macii, M. Poncino, R. Scarsi, 
"Synthesis of Low-Overhead Interfaces for Power- 
Efficient Communication over Wide Buses", DAC-99, New. 
Orleans, Louisiana, June 1999 sono stati proposti 
algoritmi per la sintesi di logiche di 
codif ica/decodif ica ad hoc con numero ridotto di 
transizioni. Questo modo di procedere deriva in modo 
automatico dei codici con bassa attivita di transizione 
e le relative implementazioni a livello di 
codica/decodif ica a partire da una caratterizzazione 
statica dettagliata del flusso target. La principale 
limitazione delle soluzioni dipendenti 

dall' applicazione e legata alia loro utilizzabilita, 
che e limitata a sistemi dedicati destinati ad eseguire 
molte volte uno stesso programma dato. 

Nel lavoro di S. Ramprasad, N. R. Shanbhag, I. N . 
Hajj, M A Coding Framework for Low-Power Address and 
Data Busses", IEEE Trans. On Very Large Scale 
Integration (VLSI) Systems, Vol. 7, No. 2, June 1999, 
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pp. 212-221, gia citato in precedenza, e stata proposta 
un'architettura generale di schema di codifica per bus 
a bassa potenza. In questa architettura, la sorgente di 
inf ormazione b (t) viene dapprima elaborata tramite una 
5 funzione fi che decorrela b (t) rispetto alia sua stima 
b A(t) ; e poi viene introdotta una variante della 
funzione di codifica entropica f 2 cosi da ridurre il 
numero medio delle transizioni. L' inf ormazione viene 
fatta passare attraverso una funzione xor, che 

10 decorrela 1' inf ormazione rispetto ai dati apparsi sul 
bus al precedente ciclo di clock. Sempre nello stesso 
lavoro sono state derivate* le prestazioni di diversi 
codici in termini di attivita di transizione e 
riportate alcune considerazioni relative 

15 all' occupazione di area, ai ritardi ed all' assorbimento 
di potenza del codif icatore/decodif icatore in relazione 
agli schemi Gray, TO e INC-Xor. Questa architettura 
generica pud essere specializzata utilizzando diverse 
alternative per le funzioni interne di decorrelazione 

20 cosi da poter derivare la maggior parte delle tecniche 
di codifica a bassa potenza di tipo noto. Tuttavia, il 
cammino critico per tra'smettere 1' inf ormazione sul bus 
pud avere un' influenza signif icativa sulle prestazioni 
a livello di sistema. In effetti, il ritardo di cammino 

25 critico del codificatore si realizza attraverso le 
funzioni fi, f2 e xor, dove fi pud implementare un 
blocco logico xor o dbm, mentre fz pud implementare le 
funzioni di identita, inv, vbm o pbm. Nel caso 
migliore, il cammino critico e dato da una coppia di 

30 porte xor* 

Le tecniche di codifica di bus descritte in 
precedenza mirano a ridurre l f attivita di commutazione 
dell' interf accia processore-memoria cambiando il 
formato dell' inf ormazione trasmessa sul bus. Altre 

35 soluzioni si basano sul cambiamento diretto del modo in 
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cui 1' inf ormazione viene immagazzinata nella memoria, 
in modo tale per cui i flussi di indirizzi hanno gia di 
per se un' attivita di transizione ridotta: al riguardo 
si pud vedere il lavoro di P. R. Panda, N. D. Dutt, 
5 "Low-Power Memory Mapping Through Reducing Address Bus 
Activity", IEEE Transactions on Very Large Scale 
Integration (VLSI) Systems, Vol. 7, No. 3, pp. 309-320, 
Sep. 1999. Le tecniche di mappatura della memoria e di 
codifica del bus non sono mutuamente esclusive. Le 

10 strategie ottimali di minimizzazione della potenza 
devono in generale sfruttare il loro effetto sinergico. 
Scopi e sintesi della presente invenzione 
La presente invenzione si prefigge lo scopo di 
superare i problemi prospettati in precedenza tramite 

15 una soluzione alternativa. 

Secondo la presente invenzione, tale scopo viene 
raggiunto grazie ad un'architettura di 

codif icatore/decodif icatore avente le carat ter is tiche 
richiamate in modo specifico nelle rivendicazioni che 

20 seguono . L' invenzione riguarda anche il relativo sistema 
elaborativo a bus. 

In sostanza, la soluzione secondo 1' invenzione si 
basa sul riconiscemento del fatto che, nei sistemi 
basati su microprocessore, si possono ottenere notevoli 

25 economie di potenza tramite la riduzione delle attivita 
di transizione dei bus di sistema. L'assorbimento di 
potenza dovuto all' attivita di transizione dei pad di 
input/output in un circuito VLSI varia dal 10% al 80% 
della potenza complessiva, con un valore tipico del 50% 

30 per i circuiti ottimizzati in funzione del basso 
assorbirnento. Fatto, questo, riconosciuto gia nel primo 
dei lavori di S. Ramprasad, N. R. Shanbhag el. N. Hajj 
citati in precedenza. L'elevata dissipazione di potenza 
associata ai pad di input/output e dovuta ai valori 

35 elevati delle capacita off-chip, che sono tipicamente 
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di due o tre ordini di grandezza maggiori delle 
capacita on-chip. II fatto di minimizzare 1'attivita di 
commutazione dei bus off-chip pud dare origine a 
notevoli economie in termini di dissipazione di 
5 potenza. 

La presente invenzione punta sui sistemi basati su 
microprocessore ad elevate prestazioni in cui per la 
comunicazione processore-memoria vengono utilizzati bus 
dati e indirizzi molto ampi. Per questa classe di 

10 sistemi, 1' invenzione mira a definire interfacce di bus 
dedicate ed architetture di codifica tali da ridurre 
1'attivita di transizione sui bus a livello di sistema, 
caratterizzati da valori elevati di capacita. Sotto 
questo punto di vista, 1' invenzione pud essere vista 

15 come un ideale sviluppo delle soluzioni che sfruttano 
il carattere locale dei dati per ridurre la potenza di 
commutazione e che richiedono nello stesso tempo un 
ridotto overhead in termini di ritardo nel cammino 
critico . 

20 In modo piu specifico, la presente invenzione 

propone un' architettura di carattere generale per 
implementare diverse classi di tecniche di codifica di 
bus che sono efficient! dal punto di vista 
dell' assorbimento di potenza e la cui caratteristica 

25 principale e quella di ridurre tanto la potenza di 
commutazione quanto la latenza di bus. Le architetture 
di codif ica/decodif ica a bassa potenza secondo 
1' invenzione possono essere utilizzate in unione con 
tecniche di allocazione di memoria del tipo di quella 

30 descritta nel lavoro di P. R. Panda, N. D. Dutt, "Low- 
Power Memory Mapping Through Reducing Address Bus 
Activity", IEEE Transactions on Very Large Scale 
Integration (VLSI) Systems, Vol. 7, No. 3, pp. 309-320, 
Sep. 1999. Tali tecniche di allocazione di memoria 

35 pongono l'accento sui carattere sequenziale degli 
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accessi per minimi zzare ulteriormente il numero medio 
delle transizioni sulle linee di bus. 

Le caratteristiche principali della soluzione 
secondo 1' invenzione sono le seguenti. 
5 1/ architettura di sistema target considerata e 

molto generale ed in grado di modellare la 
comunicazione a livello hardware/software sui bus a 
livello di sistema in termini dei principali parametri 
che influenzano la potenza di commutazione del sistema: 

10 alimentazione, frequenza, attivita di transizione e 
carico capacitivo. 

L' architettura di codif ica/decodif ica proposta 
implementa diverse classi di tecniche di codifica di 
bus e consegue un' ottimizzzione in termini di 

15 temporizzazione : il ritardo del cammino critico viene 
minimizzato cosi da ridurre la latenza degli accessi al 
bus . 

Per migliorare ulteriormente 1' attivita di 
transizione sui bus a livello di sistema e possibile 

20 implementare, utilizzando 1' architettura di 

codif icatore/decodif icatore proposta, diverse tecniche 
di codifica a bassa potenza, adatte per l'impiego su 
bus indirizzi, caratterizzate da un elevato carattere 
locale dei riferimenti di memoria. 

25 L' implementazione dell' architettura di 

codif ica/decodif ica dimostra che f per bus con elevati 
carichi capacitivi, 1'economia in termini di potenza 
dovuta alia riduzione dell' attivita di transizione non 
viene penalizzata dall' overhead in termini di potenza 

30 introdotto dalla logica di codif ica/decodif ica . 

Descrizione particolareggiata dei diseqni 
L' invenzione verra ora descritta, a puro titolo di 
esempio non limitativo, con riferimento ai disegni 
annessi, nei quali: 
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- la figura 1 illustra in generale 1' architettura 
del sistema target attuabile con 1' invenzione, 

la figura 2, cornprendente quattro diverse 
sezioni indicate rispettivamente come a, b, c e d, 
5 illustrano quattro possibili conf igurazioni di 
interfaccia di bus, 

- la figura 3 illustra, sotto forma di uno schema 
a blocchi, una possibile conf igurazione di una 
struttura di codificatore operante secondo 

10 1' invenzione, 

le figure 4 a 7 illustrano quattro diverse 
possibili architetture di codif icatore/decodif icatore 
secondo 1' invenzione specializzate in funzione 
dell' impiego di diversi schemi di codif ica, 

15 la figura 8 illustra una possibile modifica della 

parte di codificatore dell' architettura della figura 4 
sviluppata in funzione di applicazioni ad alta 
velocita, e 

la figura 9 illustra la versione ad alta 
20 velocita della sezione codificatore della struttura 
illustrata nella figura 5. 

Descrizione particolareggiata di esempi di 
attuazione preferita dell' invenzione 

A titolo introduttivo e opportuno descrivere in 
25 primo luogo la struttura dell' architettura proposta per 
modellare la comunicazione a livello di sistema. Tutto 
questo per esaminare successivamente gli schemi di 
codif ica proposti. 

In particolare, la figura 1 rappresenta, sotto 
30 forma di uno schema a blocchi, 1' architettura del 
sistema target. Si tratta essenzialmente di un sistema 
multiprocessore a memoria condivisa suscettibile di 
essere implementato utilizzando una struttura di tipo 
monolitico (System-On-a-Chip) ovvero un approccio di 
35 tipo multichip. 
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II sistema comprende uno o piu processori P0, . .., 
Pn, le rispettive cache di istruzioni (I-cache) e dati 
(D-cache) , il controllore di memoria MC, la memoria 
principale MM, i controllori di ingresso e uscita (I/O 
5 controller) , le unita periferiche, nonche i co- 
processor! CPO, ... , CPm per sopportare specifiche 
applicazioni (ad esempio MPEG) . Tutti questi blocchi di 
base sono collegati attraverso una rete di 
interconnessione IN comprendenti bus di indirizzi, dati 

10 e di controllo implementati sfruttando diverse 
topologie. Data 1' architettura target, gli aspetti 
funzionali prevalenti sono quelli collegati ai criteri 
di comunicazione hardware/software tanto sui bus a 
livello di sottosistema, quali i bus processore-cache, 

15 quanto sui bus a livello di sistema. 

Nell' architettura target si introduce 

un' interf accia di bus ai livelli di sottosistema e di 
sistema al fine di poter condizionare i quattro 
parametri che influenzano la potenza di commutazione 

20 del sistema: aliraentazione, frequenza, attivita di 
commutazione, carico capacitivo. 

Nella figura 2 vengono presentate quattro diverse 
architetture per il modulo di interf accia di bus. 

In particolare la soluzione rappresentata nella 

25 figura 2a attua una funzione di scalamento tramite 
traslazione di livello, attuata tramite moduli LS 
essenzialmente configurati come traslatori di livello 
(level shifter) . Questo tipo di interfaccia si basa 
sull' approccio denominato schedulazione delle tensioni 

30 di alimentazione a livelli multipli. In pratica, le 
varie parti dell' architettura del sistema target 
vengono alimentate con livelli di tensione diversi cosi 
da ridurre 1'energia globale. In sostanza, questa 
soluzione prevede di ridurre 1' assorbimento di potenza 

35 tenendo conto dei limiti in termini di throughput e di 
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risorse. In sostanza i moduli del sistema che si 
trovano sui caxnmini critici vengono alimentati con la 
tensione massima, evitando cosi qualunque aumento del 
ritardo. Dall'altra parte, la tensione fornita ai 
5 moduli che non sono sui cammini critici viene 
minimizzata tramite tecniche di scalamento di tensione. 
La presenza, nell'ambito del sistema, di blocchi logici 
alimentati con livelli di tensioni diversi impone 
l'impiego di traslatori di livello LS in corrispondenza 

10 dell' interf accia di bus. 

La soluzione rappresentata nella figura 2b prevede 
invece di utilizzare blocchi 

moltiplicatori/demoltiplicatori di frequenza FDM che 
realizzano un'azione di modellamento della 

15 comunicazione sui bus quando i moduli logici operano 
con diverse frequenze operative. 

La soluzione rappresentata nella figura 2c prevede 
l'impiego di blocchi di codifica E e di decodifica D 
cosi da modificare l'attivita di transizione dei bus. 

20 La struttura dei blocchi E e D verra discussa nel 
seguito in maggior dettaglio. 

Infine, la soluzione rappresentata nella figura 2d 
prevede semplicemente lo svolgimento di un'azione di 
buffer tramite rispettivi moduli Bl, B2 (peraltro 

25 previsti anche nelle altre soluzioni descritte in 
precedenza) al fine di disaccoppiare i carichi 
capacitivi. I buffer Bl, B2 possono essere inseriti in 
corrispondenza delle interfacce modulo/bus e possono 
essere utilizzate per dividere l'intero bus in diversi 

30 segmenti di bus. Questa soluzione e descritta, ad 
esempio, nel lavoro di J. Y. Chen, W. B. Jone, J. Wang, 
H.-I- Lu., and T. F. Chen "Segmented Bus Design for 
Low-Power Systems," IEEE Transactions on Very Large 
Scale Integration (VLSI) Systems, Vol. 7, No. 1, pp. 

35 25-29, Mar. 1999. 
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Con specifico riferimento ai blocchi di 
codif ica/decodif ica (Encdec) a cui si e fatto cenno in 
precedenza, 1' invenzione propone uno schema che 
mantiene un ampio rnargine di generality minimizzando 
peraltro i ritardi di cammino critico cosi da ridurre 
la latenza di bus. Le prestazioni dello schema di 
codif ica/decodif ica costituiscono un' esigenza 

essenziale dal momento che l'ampiezza di bus e la 
frequenza di clock sono in costante crescita. Pertanto, 
e importante perseguire un' ottimizzazione simultanea 
dei parametri di potenza e di temporizzazione. 

La porzione di codifica relativa e illustrata, in 
termini general!, nella figura 3. Nelle figure 
successive sono invece illustrate le specifiche 
strutture delle sezioni di codifica e di decodifica per 
ciascuna fra diverse tecniche di codifica considerate. 

In generale, con riferimento alia figura 3, il 
codificatore riceve come ingresso b (t) il valore 
corrente di informazione all'istante t e genera come 
uscita B {t) , il valore sulle linee di bus codif icate 
alio stesso istante t. 

II codificatore in questione comprende in primo 
luogo di due registri 10, 12, rispettivamente per b (t_1) 
e B tt_1> , ossia per i valori di ingresso e di uscita 
all'istante precedente t-1, nonch6 tre blocchi di 
logica combinatoria . 

Si tratta per la precisione di : 
un blocco di predizione P 



del valore 
(t-D 



che genera una 
corrente di b (t) 
ossia 

(1) 

un blocco di decorrelazione D, che realizza 
un'azione di decorrelazione dell' uscita b (t) rispetto al 
suddetto valore di predizione o di stima ossia: 



predizione o stima b' 
sulla base del valore precedente b 



35 



= D(b 



V /N (t) 



(2) 
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ed infine 

- un blocco selettore S suscettibile di scegliere, 
quale valore di uscita, uno fra i suoi ingressi b (t) , 
B <t-i> ed e (t> . 

5 Dal momento che lo scopo delle tecniche di 

codifica proposte e quello di minimizzare tanto 
l'assorbimento globale in termini di potenza quanto la 
latenza di bus, le relative funzioni di codifica 
vengono ottimizzate con un duplice scopo, 

10 Da una parte, si deve fare in raodo che 1' overhead 

di potenza dovuto al codif icatore/decodif icatore venga 
mantenuto al di sotto del risparmio in termini di 
potenza dovuto alia riduzione dell' attivita di 
commutazione di bus. Di conseguenza 1' hardware relativo 

15 alle funzioni di codifica deve essere quanto piu 
possibile contenuto . Dall'altra parte, il ritardo di 
cammino critico (attraverso i blocchi D e S) viene 
minimizzato cosi da ridurre la latenza all'accesso di 
bus . 

20 Di preferenza, almeno per alcuni dei suddetti 

blocchi logici, e preferita un' implementazione di tipo 
pass-gate. 

Ad esempio, si pud considerare il blocco S, che 
pud implementare la funzione di multiplexer (mux) o la 

25 funzione xor; nel primo caso sono necessari due pass- 
gate ed un invertitore, mentre nel secondo caso sono 
richiesti due pass-gate e due invertitori. In entrambi 
i casi, il cammino critico del blocco S e dato dal 
ritardo di propagazione attraverso un invertitore ed un 

30 pass-gate. 

La tabella che segue raccoglie diverse possibili 
implementazioni delle funzioni di codifica P, D e S 
corrispondenti a diverse classi di codifica (colonna 
piu a sinistra della tabella) discusse nella parte 

35 introduttiva della precedente descrizione. 
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CODIFICA 


P 


D 


S 


RED. 


TO 


Inc. 


Xor 


Mux. 


Y 


Bus-Invert 


Id. 


Xor 


Inv. 


Y 


TO-Bus-Invert 


Inc. /Id. 


Xor 


Mux. /Inv. 


Y 


TO-Xor 


Inc. 


Xor 


Xor 


Y 


Offset 


Id. 


Diff . 




Y 


Off set-Xor 


Id. 


Diff . 


Xor 


Y 


TO-Off set 


Inc. /Id. 


Xor/Dif f . 


Mux 


Y 


TO-Xor-Offset 


Inc. /Id. 


Xor/Dif f . 


Xor 


Y 



Per ciascuna classe di codici indicata nella 
colonna di sinistra, la stessa tabella indica quaii 
funzioni sono implementate per ciascuno dei blocchi P, 
D e S mentre la colonna piu a destra indica il f at to 
che si tratti (X) o meno (N) lo schema di tipo ridotto. 

Nella tabella, la voce Inc. identifica 
evidentemente la linea ridondante a cui si e piu volte 
fatto riferimento nella parte introduttiva della 
descrizione. La voce Id. corrisponde alia funzione 
identita, la voce Xor alia omologa funzione logica e la 
voce Diff. alia differenza. Infine, le voci Inv. e Mux. 
Corrispondono alia funzione di inversione logica e di 
multiplexer. 

Si apprezzera che nel caso del codice Offset non 
sono presenti registri relativi a B u> . 

In generale, la struttura rappresentata nella 
figura 3 e rnappata nelle figure 4, 5, 6 e 7 in modo 
tale da implementare rispettivamente i codici TO, TO- 
Xor, Offset e Offset-xor. 

Nelle figure 4 a 7 gli stessi riferimenti 
alf anumerici sono stati utilizzati per indicare parti 
identiche o equivalenti a quelle introdotte nella 
figura 3. Nelle stesse figure 4 a 7, i riferimenti 
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numeric! 14 e 16 rappresentano rispettivi registri 
presenti nella parte di decodifica. 

Negli stessi disegni il riferimento numerico 17 
indica la funzione Inc., mentre il riferimento 18 
5 indica corrispondenti porte logiche di tipo Xor. I 
riferimenti 20, 22 indicano, rispettivamente, nodi di 
differenza e di somma. 

Nella sola figura 3, il riferimento 24 indica due 
moduli che implementano la funzione mux. 

10 La figura 8 illustra i dettagli della sezione di 

codifica rappresentata nella figura 4 in particolare 
per quanto riguarda il fatto che il ritardo di cammino 
critico si estende a partire dalla linea b <t:> verso B (t) 
passando attraverso la porta Xor 18 1' invertitore 26 ed 

15 il pass-gate 28. 

La figura 9 illustra una versione ad alta velocita 
della sezione di codifica dell' architettura relativa al 
codice TO-Xor rappresentata nella figura 5. Nello 
schema della figura 9, il cammino critico e stato 

20 ridotto ad un singolo pass-gate 28 rispetto al ritardo 
delle due porte Xor 18 della figura 5. Nella versione 
ad alta velocita della figura 9 la maggior parte della 
logica e stata pre-calcolata durante il ciclo di clock 
precedente - 

25 Naturalmente, fermo restando il principio 

dell'invenzione, i particolari di realizzazione e le 
forme di attuazione potranno essere variati rispetto a 
quanto descritto ed illustrato, senza per questo uscire 
dall'ambito della presente invenzione, cosi come 

30 definita dalle rivendicazioni annesse. Cio vale, ad 
esempio, per la forma di attuazione illustrata nella 
figura 6 dove il blocco di selezione (S nello schema 
della figura 3) e di fatto assente o, in alternativa, 
pud essere visto come di fatto integrato con il blocco 
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di decorrelazione, il blocco di predizione essendo 
configurato per implementare la funzione identita. 
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RIVENDICAZIONI 

1. Architettura di codif icatore/decodif icatore per 
bus suscettibile di ricevere un valore corrente di 
informazione di ingresso (b (t) ) relativo ad un istante 
dato e di generare, a partire da detto valore corrente 
di ingresso, un corrispondente valore corrente di 
su linee di bus codificate relativo alio 
dato, caratterizzata dal fatto che 



(B (t) ) 



per 
di 



uscita 

stesso istante 
comprende : 

almeno un elemento di memoria (10, 12) 
memorizzare rispettivi valori precedenti 
informazione di ingresso (b^" 1 ') e di uscita (B (t ~ a> ), 

- un blocco di predizione (P) per generare una 
stima (b^^ 5 ) di detto valore corrente di informazione 
di ingresso a partire da detto valore precedente di 
informazione di ingresso, e 

- un blocco di decorrelazione (D) per decorrelare 
detto valore corrente di informazione di ingresso 
rispetto a detta stima cosi da produrre un risultato di 
decorrelazione (e (t) ) , 

detto valore corrente di uscita (B (t) ) essendo 
suscettibile di essere selezionato come uno fra: 

- detto valore corrente di informazione di 
ingresso (b (t) ) , 



- detto valore precedente di uscita (B 



<t-i) 



) , 



35 



- detto risultato di decorrelazione (e* J )• 

2. Architettura secondo la rivendicazione 1, 
caratterizzata dal fatto che comprende un blocco di 
selezione (S) per scegliere detto valore corrente di 
uscita {B it] ) . 

3. Architettura secondo la rivendicazione 1 o la 
rivendicazione 2, caratterizzata dal fatto che 
comprende rispettivi registri (10, 12) per memorizzare 
detti rispettivi valori precedenti di informazione di 
ingresso 



(b (t ' X) ) e di uscita (B (t_1) ) 
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4. Architettura secondo una qualsiasi delle 
precedent! rivendicazioni, caratterizzata dal fatto che 
almeno uno di detti detti blocchi (P, D, S) e almeno in 
parte implementato tramite pass-gate (28) 
5 5. Architettura secondo una qualsiasi delle 

precedenti rivendicazioni, caratterizzata dal fatto che 
comprende : 

quale blocco di predizione (P) , una linea 
ridondante (17) pref eribilmente configurata per 
10 trasferire inf ormazione sulla sequenzialita di detta 
inf ormazione, 

- quale blocco di decorrelazione (D) , una porta 
logica xor (18) , e 

- quale blocco di selezione (S) per scegliere 
15 detto valore corrente di uscita, un multiplexer (24). 

6. Architettura secondo la rivendicazione 5, 
caratterizzata dal fatto che detto blocco di selezione 
(S) comprende un inverter (26) ed un pass-gate (28) . 

7. Architettura secondo una qualsiasi delle 
20 rivendicazioni 1 a 4, caratterizzata dal fatto che 

comprende : 

- quale modulo di predizione (P), un modulo di 
identita, 

- quale blocco di decorrelazione (D) , una porta 
25 logica xor, e 

- quale blocco di selezione (S) per scegliere 
detto valore corrente di uscita, un inverter. 

8. Architettura secondo una qualsiasi delle 
rivendicazioni 1 a 4, caratterizzata dal fatto che 

30 comprende: 

quale modulo di predizione (P) , uno fra una 
linea ridondante pref eribilmente configurata per 
trasferire informazione sulla sequenzialita detta 
inf ormazione ed un modulo di identita, 



^^^^^ ^S^^SS fnio : " " 



- quale blocco di decorrelazione (D) , una porta 
logica xor, e 

- quale blocco di selezione (S) per scegliere 
detto valore corrente di uscita, uno fra un multiplexer 

5 ed un inverter. 

9. Architettura secondo una qualsiasi delle 
rivendicazioni 1 a 4, caratterizzata dal fatto che 
comprende : 

quale blocco di predizione (P), una linea 
10 ridondante (17) pref eribilmente configurata per 
trasferire inf ormazione sulla sequenzialita detta 
informa z ione , 

- quale blocco di decorrelazione (D), una porta 
logica xor (18), e 

15 - quale blocco di selezione (S) per scegliere 

detto valore corrente di uscita, una porta logica xor 
(18) . 

10. Architettura secondo la rivendicazione 9, 
caratterizzata dal fatto che detto blocco di selezione 

20 (S) comprende un inverter (26) ed un pass-gate (28) . 

11. Architettura secondo la rivendicazione 1, 
caratterizzata dal fatto che comprende: 

- quale blocco di predizione (P) , un modulo di 
identita, e 

25 - quale blocco di decorrelazione (D) , suscettibile 

anche di scegliere detto valore corrente di uscita 
(B (t) )f un modulo di differenza (20). 

12. Architettura secondo una qualsiasi delle 
rivendicazioni 1 a 4, caratterizzata dal fatto che 

30 comprende: 

- quale blocco di predizione (P) , un modulo di 

identita, e 

- quale blocco di decorrelazione (D) , un modulo di 
differenza (20), e 
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- quale blocco di selezione (S) , suscettibile di 
scegliere detto valore corrente di uscita (B) , una 
porta logica xor (18). 

13. Architettura secondo una qualsiasi delle 
5 rivendicazioni 1 a 4, caratterizzata dal fatto che 
comprende : 

- quale blocco di predizione (P) , uno fra una 
linea ridondante (17) pref eribilmente configurata per 
trasferire informazione sulla sequenzialita detta 

10 informazione ed un modulo di identita, 

- quale blocco di decorrelazione (D) , uno fra una 
porta logica xor (18) e un modulo di differenza, e 

- quale blocco di selezione (S) per scegliere 
detto valore corrente di uscita, un multiplexer (24). 

15 14. Architettura secondo una qualsiasi delle 

rivendicazioni 1 a 4, caratterizzata dal fatto che 
comprende : 

- quale blocco di predizione (P) , uno fra una 
linea ridondante (17) pref eribilmente configurata per 

20 trasferire informazione sulla sequenzialita detta 
informazione ed un modulo di identita, 

- quale blocco di decorrelazione (D), uno fra una 
porta logica Xor (18) e un modulo di differenza, e 

quale blocco di selezione (S) per scegliere 
25 detto valore corrente di uscita, una porta logica xor. 

15. Sistema elaborativo a bus comprendente almeno 
un interfaccia di bus basata su un architettura secondo 
una qualsiasi delle precedenti rivendicazioni. 

16. Sistema secondo la rivendicazione 15, 
30 caratterizzato dal fatto che detta almeno 

un' interfaccia di bus opera a livello di sottosistema . 

17. Sistema secondo la rivendicazione 16, 
caratterizzato dal fatto che detta almeno 
un' interfaccia di bus opera a livello di bus 

35 processore-cache . 



18. Sistema secondo la rivendicazione 15, 
caratterizzato dal fatto che detta almeno 
un'interfaccia di bus opera a livello di di sistema. 

19. Sistema secondo una qualsiasi delle 
5 rivendicazioni 15 a 18, sotto forma di sistema 

multiprocessore a memoria condivisa. 

20. Sistema secondo una qualsiasi delle 
rivendicazioni 15 a 19, implementato utilizzando una 
struttura di tipo monolitico (System-On-a-Chip) . 

10 21. Sistema secondo una qualsiasi delle 

rivendicazioni 15 a 19, implementato utilizzando una 
struttura di tipo multichip. 
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RIASSUNTO 

Un' architettura di codif ica/decodif ica per bus 
suscettibile di minimizzare 1' assorbimento di potenza 
riducendo l'attivita di commutazione genera, a partire 
da un valore di inf ormazione di ingresso (b (t) ) relativo 
ad un istante dato (t), un corrispondente valore 
corrente di uscita (B (t) ) su linee di bus codif icate 
relativo alio stesso istante dato. 1/ architettura 
comprende mezzi di memorizzazione (10, 12) per 
memorizzare rispettivi valori precedenti di 
inf ormazione di ingresso (b (t_1) ) e di uscita (B (t " 1) ) 
relativi ad istanti precedenti al suddetto istante dato 
(t) . Un blocco di predizione (P) genera, a partire dal 
valore precedente di inf ormazione di ingresso, una 
stima (b" (t> ) del valore corrente di inf ormazione di 
ingresso. Un blocco di decorrelazione (D) decorrela il 
valore corrente di inf ormazione di ingresso (b (t) ) 
rispetto a detta stima. Infine, un blocco di selezione 
(S) sceglie quale valore corrente di uscita (B {t) ) uno 
fra il valore corrente di informazione di ingresso 
(b (t) ), il risultato della decorrelazione (e (t) ) attuato 



dal blocco di decorrelazione 
precedente di uscita (B (t_1) ). 
(Figura 3) 



(D) ovvero il valore 
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